文字起こしやサポーター向けコンテンツを語る from BC054
(ごりゅご)ブックカタリスト、アフタートーク。今回は第54回、『語学の天才まで1億光年』のアフタートークです。
(倉下)お疲れ様でした。
(ごりゅご)新しくちょっと興味があるのが、前回のアフタートークでテキストにできるっていうやつ(Whisper.cpp)の話をしたじゃないですか。試してみたところ大変精度が高く、楽なんですよね、作るのが。
ちょっと思いついたレベルなんですけれども、『ブックカタリスト・リマスタリング・プロジェクト』というので、第00回から現在までの過去の分を、録り直しはもちろんできないんですけれども、エフェクトとかもうちょっと聞きやすく編集して、第1回から配信しつつつ、ついでに文字起こしをして、そのテキスト原稿を全文検索に近いことができるようにしたら、面白いんじゃないかということを思いついていて。
(倉下)そのテキストはどこに置くの?
(ごりゅご)それも考えているところで。例えば、もう1個(substackで)配信をしてそこに置く。
(倉下)うーん。
(ごりゅご)例えばScrapboxにもう堂々と全部あげてしまう。
(倉下)それは一つの手ですよね。
(ごりゅご)例えばなんですけど、Scrapboxにあげといて、キーワードでのリンクとか関連項目へのリンクみたいなやり方にはなると思うんですけど。
(倉下)やばいプロジェクトやな。
(ごりゅご)もうちょっと資産として残せるんじゃないのか。
(倉下)たしかに。
(ごりゅご)もしくはそのサポーターの方限定で、検索でこの本について話したのがどこなんだろうって分かるようにするみたいなことも思ったりしたんですけども。
今思ってるのはなんかケチクサいことをせずにもうScrapboxに公開してしまって、このプロジェクト面白いと思ったらサポーター入ってくれませんかっていう方がいいんじゃないかなっていう気がしていて。
(倉下)ケチクサいというのはケチクサいですね、たしかに。Scrapboxに貼ってリンクできるようになれば、確実に「あの回で喋ってたの、どれやったっけ?」って探すのが便利になることは間違いないですね。
(ごりゅご)うん。
(倉下)多分もしかしたら自分のパソコンにそれを入れたい人もいるかもしれないんで、プレーンなテキストファイルもなんかどっかからダウンロードできたら、それはそれでまた別に、それぞれの人のセルフライブラリに入れられたらいいんじゃないかなという気もしますが。
(ごりゅご)それはあれかな。Githubとかに公開してもいいですけどね。そういうやり方なら。ただ、みんなでやるっていうニュアンスが割と便利なんじゃないかなと思っていて、個人的には。
(倉下)うん。
(ごりゅご)Scrapboxのキーワードは結構ガイドラインをきちんとしておかないと、どういうフォーマットで書くのかみたいなことも含めてちょっと難しいかもしれないなっていうのはあって。
(倉下)最初は一番最初は固有名詞だけリンクしてっていうところから始めてっていう感じかな。それでもだいぶ有益なものができると思うけど。
(ごりゅご)そうですね、言及してる本と。ただ一話を全部長く、どうしようかな、それも含めてどうがいいんだろうなっていういろんな。
(倉下)まぁそうやな。
(ごりゅご)えっとね、ちょっとサンプルを今見せようと思ったんですけど、ちょっと待って。いくつかフォーマットを選ぶことはできて、そのいわゆる字幕ファイル的な開き方だったり、これは時間も入ってるやつで。それで言うとなんていうんだろうな。読みやすくはないんですけど、この文脈の話がどこにあるんだろうなっていうのはそれなりにできるとか。ある意味この1単位をアトミックという考え方でもいいのかなっていう風にも思うし。
(倉下)そうか、特定の場所を探すときにも便利なのか。
(ごりゅご)グーグル検索みたいな曖昧を許容できないけど。Scrapboxはある程度曖昧さ許容してくれましたよね。
(倉下)一文字だけね。
(ごりゅご)一文字だけか。あと用語が違ったりタイプがあったりするとダメなのかな。
(倉下)そうだね。それでも全然なんもないよりは遥かに便利にはなるとは思いますが。このままペタってScrapboxに貼るだけ貼ってもいいかな。だいぶ縦に長くなりそうやから。
(ごりゅご)そう。だからそれがなんていうんだろうな。あんまScrapbox的ではないような気はするので。どういうやり方がいいのかなはあるんですけど。
(倉下)このまま全部ぺたっと貼るぐらいやったらGithubの方がいいかもね。
(ごりゅご)もう全公開してしまって。
(倉下)その方がいいかも。で、特定のその回の有益なトピックについてだけScrapboxにまた別途を個別に貼ってアトミック化していくっていう方が役割としてはいい。
(ごりゅご)そうか。その面白かった話だけそういうふうにするのか。
(倉下)そういう方がそれぞれのツールの役割としてあってる気がしますな。
(ごりゅご)Githubに一人か二人くらい参加してくれたらいいなっていう感じなんですけど。ゼロ人だと、俺とらしたさんだけでやっていたらあんま面白くないですからね。
(倉下)たしかに。
(ごりゅご)それをさらにどういうやり方をしようとか考えることは多いんですけど。この手間でできるんだったらちょっとやってみる価値はあるのかなっていうことを思っていて。なんかこういうふうにやってみたら面白いんじゃないかなというご意見などがあれば、ぜひお便りコメントなどくださいというやつですかね。
(倉下)それが今回のお題?
(ごりゅご)今思いついたそれを。
(倉下)なるほど。ブックカタリストの語り起こしテキストがあるとしてあるとしてこれをどう使ったらいいでしょうのアイディア募集ってことね。
(ごりゅご)なんていうんだろう。これをうまいこと活用してもらえるんだったら一緒に何かやるとかもやれるかもしれないなとか思うし。次の本の土台としても悪くないと思うし。
(倉下)たしかに。
(ごりゅご)それも含めて。まずもう一個同じく考えているのが00回からのリマスタリング的なところで、それをやるついでにちょっとずつテキストを起こしていったらいいかなと思っていて。なんかね、Substackはサブチャンネル的なものが作れるんですよね。
(倉下)ほう。
(ごりゅご)サブチャンネルってRSSとかメールとか別になるんですよ。で、そのサブチャンネルにその過去分の配信と文字起こし原稿を送ったりすれば、なんていうんだろう、50回あるので、結構長いことその面白がって再び聞き直すみたいなことを、YouTubeのプレミア放送みたいな感じでやれるのかなっていう。
(倉下)なるほど。
(ごりゅご)ちょっと思ったりしていて。あと0回以前のやつが探すのがめんどくさいじゃないですか。
(倉下)そうやね。
(ごりゅご)とかも、多少便利になるかもしれない。50回分あったらそれなりにいいネタにはなるかもしれないなとか。
(倉下)うん、そうやな。
(ごりゅご)あと音源ファイルをMP3ファイルを作ってもうほぼほぼカンパなんですけど買いませんかっていう言い方もできるし。
(倉下)個人的ではそっちがいいかなという気はしている。
(ごりゅご)ん?ファイルを?
(倉下)MP3をパッケージ何回分がまとめて買ってもらう。買ってもらうっていうか何かの形で売る。
(ごりゅご)うん。それはね前に東京ポット許可局が過去分のアーカイブを全部入ったUSBメモリを売るって言っていて。ちょっと欲しいって思ったんですよ、そのカンパも含めて。で同じことを思ってくれる人はいるかもしれないなと思って。
(倉下)例えば、Substackが飛んだら音源なくなるわけですね、一般的に聞ける。だから、アニメを見た人がDVD買うみたいな感じで音源を売っても別に。しかも、ちゃんときれいになっている音源を売るのは一つ価値の提供かなという気がしましたが。
(ごりゅご)うん。ちょっと第00と0回以前を3回録っているはずなので。それを1回まとめてみてちょっと考えてみましょうかねって感じかな。らしたさんも乗り気ならなんかやれることができる増えるかもしれない。
(倉下)うん、結構いいんじゃないですかね。MP3で買ったら自分のiTuneじゃないや、ミュージックとかに入れて聞くこともできるし。自分でライブラリを作ってるんだったらそこにも入れられるし、記念品にもなるし。
(ごりゅご)実は頑張ればPodcastアプリからMP3抜くなんて簡単にできると思うんですけど。
(倉下)でもやらないでしょ。
(ごりゅご)そうそう、わかるわかる。別にやってくれていいですからねそういう意味で言ったら。
(倉下)それはもちろん自分でやっておられたらいいですけど。でも我々がちゃんとしたものをバックルっていうことは、消費者側っていうかユーザー側の手間省きにもなるし、きれいな音源を渡すこともできるし、いろいろwinじゃないですか、きっと。
(ごりゅご)うん。ちょっとやってみます。そうは言っても、最初期とか結構ねノイズが多かったりして、できる限界はあって。前よりは良くなると思うぐらいのもので。Red Zeppelinのライブリマスタリングみたいなそういう世界には到達できないので。
(倉下)でもいいんじゃないですかね、個別でそうやって。僕も今Kindleで売ってる本とかをEPUBでちゃんとダウンロードできる形式で売れへんかなと考えてるんですよ。結局その人の手元にちゃんと残る形で売りたいなとずっと思ってたんで、なんかそれに近い感じになるんですね。
(ごりゅご)そうですね。アトミック・シンキングもね言われた。ペーパーバッグ手に入らんかなって言われて嬉しかったんですけど。作るのくっそ大変な上に、売ると多分2000円で利益出ないとかになってしまって。
(倉下)めちゃめちゃ高くなるからね。
(ごりゅご)うん、そう。EPUBならただあの規約的にダメなんですよねKindleは。
(倉下)そう。だから、専売から外さなあかんので新しい本はちょっとできないですけど。もうあんまり売れてない古い本とかやったら個別に販売することも一応買えられるので。やっぱその方がやっぱ所有してる本とかっていう意味ではそっちの方がいいかなという気がしているところです。
(ごりゅご)そうですね。過去回とかも、例えばまずいくらだったらあの買ってもいいと思えるのかとか。何話分まとまったものがいいかとか。
(倉下)難しいよね。1話が結構長いからね。
(ごりゅご)何話分まとまったらいいのかもあるし、いくらぐらいならいいかだし。ただデータがいいのか、例えばそういう東京ポッド許可局はあえてUSBメモリーという物理媒体を使ってるんですよね。で分からんけど、多分ブックカタリストのロゴがついたUSBメモリーを作るとかも不可能ではないんですよね。ただそれは当然割高になるし手間も増えるし。欲しいとそもそも欲しいと思ってくれる人がいるのかどうかから。
(倉下)スタートはそこだよね。過去の音源をお金出して買うっていうテンションがどれぐらいあるかどうかっていうところから始める。
(ごりゅご)9割カンパだと思ってもらわないといけないですね。
(倉下)一応ただで聞けるわけですよね。
(ごりゅご)ただで聞けるし合法的に自分の手元にダウンロードできるものをオフィシャルで売るっていうだけなので。もしそういうのに興味あったら今日コメントなどお便りなどいただければより強く進むと思います。
それと同時に文字起こしした文を、Scrapboxじゃない、Githubかな。ちょっとそれも考えてみてちょうどリアルの時間でいうと年末年始を挟むのでそこでちょっとやってみてですかね。
(倉下)Githubが一番いいんじゃないかな。一番信頼度が高い長く残りそう。
(ごりゅご)Githubだとしてどうするかなんですよね。
(倉下)そうやな、どうするか。
(ごりゅご)そもそもが1枚1ファイルにするのか、もしくはそのObsidianのみたいなフォーマットでなんかこうアトミックにすることを目指すのかどうか。
(倉下)個人的には、Githubにあげるファイルは一番のソースというか。だから元々のファイル1枚形式の方がいいと思うよ。アトミックにしたかったらその人がコピペして自分のObsidianに放り込んでから処理してくださいっていう形の方が良さげな気がします。
(ごりゅご)rawをそこに置いといて各自フォークしろってことですね。
(倉下)っていう感じの方が、っぽい気がするけど。
(ごりゅご)もしくはそのrawを置いとくフォルダがあって、勝手な別枝が作られればいいので。フォルダを別のやつで作って。その辺はオープンソースを運営したことがないから分かんないんですよね。そこにどの程度興味が持てるかとかっていうのもあるし。rawを起こして自分用にやってみてそれを公開しつつっていうので。これは別に全公開でいいと思っていて割と。
(倉下)そうですね、それはそうと思います。
(ごりゅご)何なら非公開のアフタートークの分とかもテキストにしてもいいのかなと思っていて、ついでに。
(倉下)僕も全然大丈夫ですよ、それは。
(ごりゅご)文字で読んでそこまで興味を持ってくれるんだったらサポーターになってくださいっていうぐらいのやり方の方が、相性がいいのかなっていう。こういうタイプのコンテンツと。
(倉下)しかもだから最新のものを常にそこにあげる必要も別になくて。
(ごりゅご)週に1個が限界ですね。
(倉下)過去の分がちょっとずつ無料でテキストで読めますっていう形であれば、この商業体制ともそんなにぶつからないとは思いますが。
(ごりゅご)追いつくのに2年かかると思う。
(倉下)大丈夫だと思うなそれだったら。
(ごりゅご)最近その小話なんですけど、ポッドキャスト編集しながらノートを整理するという非常によろしくないながら仕事を覚えて。物理時間は確保できたんですよ。当然効率はお互い悪いんだけど、精神的な負荷が減った。
割と事務作業に近いレベルのその整理とかだったり、もしくは逆にどっちかが忙しかったらどっちかの手を止めてとかになるんですけど。ちょっと余裕ができたんで、そういう意味でもちょっとやってみてもいいのかなっていう感じはします。もし気に入っていただけたら確かSubstackでもっと多く払うとかができるのでそういうのもお願いします。
(倉下)なるほど。
(ごりゅご)そのプロジェクトで面白がってもらえればですかね、根本的なところでいうと。
(倉下)そうだね。
(ごりゅご)あとその辺のノウハウとかなら公開共有はいくらでもできるし、そういうことをやってみて面白いことがあればですね。
うちあわせキャストとかも文字起こししたいってらしたさんも言ってましたからね。
(倉下)非常にもったいないんだよね。だって自分でもどこの回で何喋ったかもう分からなくなってるから、何とかしたいなとはずっと思ってます。
(ごりゅご)ちなみにね、はるなさんはやってるんですよねそれを。
(倉下)マジ?すげえな。
(ごりゅご)iPadWorkersの音源を取ってから、Vrewっていうソフトを使って文字入力して、最低限のテキスト化をして、Obsidianに保存するということを。
https://www.youtube.com/watch?v=UpErx0Pn0mY
(倉下)そうやな。えらいな。やっぱりそういうのはちょっと真似しないといかんね。
(ごりゅご)その手のきっちりファイルを整理するとかは俺よりも相当得意みたいで。俺はいつも失くしますからね。
(倉下)一回作ったものにはもう途端に興味がなくなるんだよね。まあいいや、ちょっと何とか考えますそれはそれで考えます。
(ごりゅご)という感じで、本当に思いつきレベルでしかなくってその急いでやるものでもないので。協力してくれるという方がいれば是非一緒にやりたいし、ギャラが出るわけではないんですが。一緒に遊びながらそういうこともできたらなと思います。
(倉下)はい。
<書き起こしおわり>